Mô hình markov ẩn là gì? Các nghiên cứu về Mô hình markov ẩn

Mô hình Markov ẩn (HMM) là mô hình thống kê mô tả hệ thống có trạng thái ẩn không quan sát được, được suy luận thông qua chuỗi dữ liệu đầu ra quan sát được. Các trạng thái trong HMM tuân theo quá trình Markov, nghĩa là xác suất chuyển trạng thái chỉ phụ thuộc vào trạng thái hiện tại, không phụ thuộc lịch sử trước đó.

Mô hình Markov ẩn là gì?

Mô hình Markov ẩn (Hidden Markov Model - HMM) là một mô hình thống kê mô tả một hệ thống mà trạng thái thực sự (ẩn) của nó không thể quan sát trực tiếp, nhưng có thể được suy luận thông qua một chuỗi các tín hiệu hoặc dữ liệu quan sát được. Các trạng thái ẩn tuân theo tính chất Markov, nghĩa là xác suất chuyển trạng thái chỉ phụ thuộc vào trạng thái hiện tại và không phụ thuộc vào các trạng thái trước đó. HMM được sử dụng rộng rãi trong các bài toán xử lý ngôn ngữ tự nhiên, sinh học tính toán, nhận dạng mẫu, và mô hình hóa chuỗi thời gian trong tài chính.

Các thành phần cơ bản của HMM

Một mô hình Markov ẩn tiêu chuẩn được xác định bởi năm tham số:

  • Tập hợp trạng thái ẩn S={s1,s2,,sN}S = \{s_1, s_2, \dots, s_N\}: Các trạng thái không thể quan sát trực tiếp.
  • Tập hợp các quan sát V={v1,v2,,vM}V = \{v_1, v_2, \dots, v_M\}: Các tín hiệu có thể đo đạc hoặc ghi nhận được.
  • Ma trận xác suất chuyển trạng thái A=[aij]A = [a_{ij}]: aij=P(st+1=jst=i)a_{ij} = P(s_{t+1} = j \mid s_t = i)
  • Ma trận xác suất phát hiện (emission) B=[bj(k)]B = [b_j(k)]: bj(k)=P(ot=vkst=j)b_j(k) = P(o_t = v_k \mid s_t = j)
  • Phân phối xác suất khởi đầu π=[πi]\pi = [\pi_i]: πi=P(s1=i)\pi_i = P(s_1 = i)

Thông thường, một HMM được ký hiệu tổng quát là λ=(A,B,π)\lambda = (A, B, \pi).

Ba bài toán cơ bản trong Mô hình Markov ẩn

Để sử dụng HMM hiệu quả, cần giải quyết ba bài toán cơ bản:

  • 1. Bài toán đánh giá: Tính xác suất P(Oλ)P(O \mid \lambda) cho chuỗi quan sát OO đã cho và mô hình λ\lambda. Thuật toán Forward được sử dụng để tính nhanh giá trị này.
  • 2. Bài toán giải mã: Xác định chuỗi trạng thái ẩn tối ưu đã sinh ra chuỗi quan sát. Thuật toán Viterbi là kỹ thuật phổ biến nhất cho mục tiêu này.
  • 3. Bài toán học tham số: Ước lượng các tham số AA, BB, π\pi để tối đa hóa P(Oλ)P(O \mid \lambda). Thuật toán Baum-Welch (một dạng đặc biệt của EM) được sử dụng.

Thuật toán Forward

Thuật toán Forward tính xác suất chuỗi quan sát bằng cách đệ quy, thay vì tính tổng toàn bộ số lượng chuỗi trạng thái tiềm năng:

Định nghĩa biến forward αt(i)\alpha_t(i) là xác suất quan sát được o1,o2,...,oto_1, o_2, ..., o_t và hệ thống ở trạng thái sis_i tại thời điểm tt:

αt(i)=P(o1,o2,,ot,st=iλ)\alpha_t(i) = P(o_1, o_2, \dots, o_t, s_t = i \mid \lambda)

Thuật toán tính α\alpha theo quy trình khởi tạo, đệ quy, và kết thúc để tìm P(Oλ)P(O \mid \lambda).

Thuật toán Viterbi

Thuật toán Viterbi tìm chuỗi trạng thái ẩn tối ưu với xác suất tối đa. Biến Viterbi δt(i)\delta_t(i) được định nghĩa như sau:

δt(i)=maxs1,s2,,st1P(s1,s2,,st1,st=i,o1,o2,,otλ)\delta_t(i) = \max_{s_1, s_2, \dots, s_{t-1}} P(s_1, s_2, \dots, s_{t-1}, s_t = i, o_1, o_2, \dots, o_t \mid \lambda)

Thuật toán cũng dựa trên quy trình khởi tạo, đệ quy, và truy vết ngược để xác định chuỗi trạng thái tốt nhất.

Thuật toán Baum-Welch

Baum-Welch là thuật toán huấn luyện HMM từ dữ liệu quan sát, dựa trên nguyên lý Expectation-Maximization:

  • Expectation step: Tính kỳ vọng của số lần chuyển giữa các trạng thái và số lần sinh ra mỗi quan sát.
  • Maximization step: Cập nhật AA, BBπ\pi để tối đa hóa xác suất tổng thể.

Baum-Welch cho phép tìm được tham số hợp lý nhất khi dữ liệu huấn luyện không có nhãn trạng thái.

Ứng dụng thực tiễn của Mô hình Markov ẩn

  • Nhận dạng tiếng nói: Các hệ thống như Siri, Alexa, Google Assistant sử dụng HMM để phân tích chuỗi âm thanh và ánh xạ thành từ ngữ, chi tiết trong IEEE Tutorial on HMMs and Speech Recognition.
  • Phân tích trình tự sinh học: Dùng để tìm gene, phân tích vùng protein bằng phần mềm như HMMER.
  • Dự báo tài chính: HMM giúp mô hình hóa thị trường tài chính không ổn định và xác định các pha thị trường (bò - gấu).
  • Nhận dạng chữ viết tay: Áp dụng HMM để nhận dạng chuỗi ký tự viết tay trong tài liệu số hóa.

Ưu điểm và hạn chế của HMM

  • Ưu điểm: Hiệu quả trong xử lý chuỗi, yêu cầu ít tham số, dễ diễn giải và dễ tích hợp với các phương pháp học máy khác.
  • Hạn chế: Giả định Markov bậc 1 (chỉ phụ thuộc vào trạng thái trước đó) là hạn chế; khó mở rộng với dữ liệu phi tuyến tính hoặc có phụ thuộc dài hạn; học tham số dễ rơi vào cực trị cục bộ.

Các mô hình mở rộng từ HMM

  • HMM liên tục: Sử dụng phân phối liên tục như Gaussian để mô hình hóa đầu ra, thay vì tập giá trị rời rạc.
  • Hierarchical HMM (HHMM): Mô hình đa cấp, cho phép mô tả quá trình phức tạp hơn với nhiều lớp trạng thái ẩn.
  • Conditional Random Fields (CRFs): Khắc phục hạn chế Markov của HMM bằng cách mô hình hóa phân phối có điều kiện, được sử dụng nhiều trong gán nhãn chuỗi.

So sánh HMM với CRFs

Tiêu chí HMM CRFs
Kiểu mô hình Generative (sinh dữ liệu) Discriminative (phân biệt)
Phụ thuộc trạng thái Chỉ trạng thái hiện tại Có thể mở rộng nhiều đặc trưng hơn
Ứng dụng Nhận dạng tiếng nói, sinh học Gán nhãn chuỗi, phân loại

Kết luận

Mô hình Markov ẩn là một trong những công cụ nền tảng cho việc phân tích và dự đoán chuỗi dữ liệu trong khoa học máy tính và trí tuệ nhân tạo. Dù tồn tại một số giới hạn về khả năng mô hình hóa các phụ thuộc phức tạp, HMM vẫn giữ vai trò cốt lõi trong nhiều ứng dụng thực tế và là nền tảng cho sự phát triển của các mô hình chuỗi tiên tiến hơn như LSTM và CRFs.

Các bài báo, nghiên cứu, công bố khoa học về chủ đề mô hình markov ẩn:

Các Biện Pháp Bayesian Cho Độ Phức Tạp và Độ Khớp Của Mô Hình Dịch bởi AI
Journal of the Royal Statistical Society. Series B: Statistical Methodology - Tập 64 Số 4 - Trang 583-639 - 2002
Tóm tắtChúng tôi xem xét vấn đề so sánh các mô hình phân cấp phức tạp trong đó số lượng tham số không được xác định rõ. Sử dụng lập luận thông tin lý thuyết, chúng tôi đưa ra một thước đo pD cho số lượng tham số hiệu quả trong một mô hình như sự khác biệt giữa trung bình hậu nghiệm của độ lệch và độ lệch tại giá trị trung bình hậu nghiệm của các tham số quan trọng....... hiện toàn bộ
#Mô hình phân cấp phức tạp #thông tin lý thuyết #số lượng tham số hiệu quả #độ lệch hậu nghiệm #phương sai hậu nghiệm #ma trận 'hat' #các họ số mũ #biện pháp đo lường Bayesian #biểu đồ chuẩn đoán #Markov chain Monte Carlo #tiêu chuẩn thông tin độ lệch.
Một mô hình Markov ẩn trong dự báo chỉ số chứng khoán VN-Index
Tạp chí tin học và điều khiển học - Tập 28 Số 3 - 2012
Phân tích và dự đoán thị trường cổ phiếu là một trong những lĩnh vực thúvị mà trong đó dữ liệu lịch sử có thể được sử dụng để ước tính và dự đoán dữliệu và thông tin của tương lai. Về mặt kỹ thuật mà nói, lĩnh vực này có tầmquan trọng lớn cho các chuyên gia trong tài chính và thị trường chứng khoánnhư là họ co thể nắm bắt và điều chỉnh xu hướng tương lai hoặc quản lý khủnghoảng theo thời gian. Tro...... hiện toàn bộ
So sánh phương pháp nhận dạng hành động con người trong đoạn video quay bằng một camera dùng DTW và HMM
Tạp chí Khoa học và Công nghệ - Đại học Đà Nẵng - - Trang 64-68 - 2014
Trong bài báo này, chúng tôi tìm hiểu và so sánh hai thuật toán nhận dạng Dynamic Time Warping (DTW) và mô hình Markov ẩn HMM. Trước tiên, từ mỗi khung video, chúng tôi ước lượng tư thế người 3D, bao gồm tọa độ 3D của các khớp đặc trưng, dùng kỹ thuật mô hình hóa cơ thể 3D; rồi chuyển các tọa độ này sang thuộc tính quan hệ hình học GRF, mô tả quan hệ hình học giữa các khớp trong một tư thế nhằm gi...... hiện toàn bộ
#Dynamic Time Warping (DTW) #Nhận dạng hành động con người #mô hình hóa người 3D #thuộc tính quan hệ hình học #mô hình Markov ẩn tuần hoàn
XÂY DỰNG VÀ HIỆU CHỈNH CẤU TRÚC MÔ HÌNH ĐÁNH GIÁ CHI PHÍ – HIỆU QUẢ CỦA CHƯƠNG TRÌNH CAN THIỆP SỨC KHỎE TÂM THẦN VỊ THÀNH NIÊN TRONG TRƯỜNG HỌC TẠI VIỆT NAM
Tạp chí Y học Việt Nam - Tập 510 Số 2 - 2022
Mục tiêu: Xây dựng và hiệu chỉnh cấu trúc mô hình Markov để đánh giá chi phí – hiệu quả chương trình can thiệp sức khỏe tâm thần vị thành niên trong trường học tại Việt Nam. Phương pháp: Sử dụng tổng quan hệ thống, tổng quan tài liệu kết hợp với phỏng vấn sâuchuyên gia trong lĩnh vực sức khỏe tâm thần, kinh tế y tế, y tế và giáo dục (10 chuyên gia) và thảo luận nhóm (01 cuộc thảo luận nhóm). Kết q...... hiện toàn bộ
#đánh giá kinh tế y tế #mô hình hóa #mô hình markov #can thiệp dự phòng trầm cảm #can thiệp sức khỏe tâm thần
Đánh giá chi phí - hiệu quả của chụp nhũ ảnh sàng lọc tại một quốc gia thu nhập thấp: Phân tích mô phỏng Markov Dịch bởi AI
BMC Medical Imaging - Tập 21 Số 1 - Trang 1-8 - 2021
Ung thư vú là loại ung thư phổ biến nhất ở phụ nữ. Chụp nhũ ảnh sàng lọc là phương pháp sàng lọc hình ảnh duy nhất cho ung thư vú có lợi ích rõ ràng về tỷ lệ tử vong. Nghiên cứu này nhằm phân tích chi phí - hiệu quả của chụp nhũ ảnh sàng lọc tại Ethiopia. Mô hình Markov đa trạng thái đã được sử dụng để mô phỏng máy tính nhằm ước lượng chi phí và lợi ích sức khỏe của các can thiệp chụp nhũ ảnh sàng...... hiện toàn bộ
#chụp nhũ ảnh sàng lọc #ung thư vú #đánh giá chi phí - hiệu quả #mô hình Markov #Ethiopia
Sự hội tụ đến phân phối trạng thái trong các mô hình cạnh tranh ngẫu nhiên hai loài Dịch bởi AI
Journal of Mathematical Biology - Tập 27 - Trang 451-462 - 1989
Hai tập hợp điều kiện đủ được đưa ra để đảm bảo sự hội tụ đến các phân phối trạng thái, cho một số mô hình tổng quát của hai loài cạnh tranh trong một môi trường biến đổi ngẫu nhiên. Các mô hình này là các phương trình sai phân ngẫu nhiên phi tuyến định nghĩa các chuỗi Markov. Một tập hợp điều kiện đủ liên quan đến sự liên tục mạnh và tính phi giảm φ của xác suất chuyển trạng thái của chuỗi. Tập h...... hiện toàn bộ
#hội tụ #phân phối trạng thái #mô hình cạnh tranh ngẫu nhiên #chuỗi Markov #phương trình sai phân ngẫu nhiên
Một thuật toán giải mã mới cho các mô hình Markov ẩn cải thiện dự đoán cấu trúc của các protein màng loại beta Dịch bởi AI
BMC Bioinformatics - Tập 6 - Trang 1-7 - 2005
Dự đoán cấu trúc của protein màng vẫn là một bài toán tính toán đầy thách thức. Các mô hình Markov ẩn (HMM) đã được áp dụng thành công cho bài toán dự đoán cấu trúc protein màng. Trong một nhiệm vụ dự đoán, HMM được trang bị một thuật toán giải mã nhằm gán đường đi trạng thái xác suất cao nhất, và từ đó gán nhãn, cho một chuỗi chưa biết. Thuật toán Viterbi và thuật toán giải mã hậu (posterior) là ...... hiện toàn bộ
#mô hình Markov ẩn #protein màng #dự đoán cấu trúc #giải mã #thuật toán Viterbi
NHẬN DẠNG DẤU THANH VÀ MŨ TRONG KÝ TỰ TIẾNG VIỆT VIẾT TAY
Tạp chí Khoa học và Công nghệ - Đại học Đà Nẵng - - Trang 21-24 - 2014
Nhận dạng ký tự viết tay là chủ đề đang được nghiên cứu rộng rãi hiện nay. Nhiều giải pháp được áp dụng cho ký tự tiếng Anh và mang lại hiệu quả cao. Tuy nhiên, bài toán tiếng Việt đang đối mặt với nhiều thách thức, phần lớn vấn đề đến từ dấu mũ và dấu thanh (gọi chung là dấu). Bài báo này đề xuất một giải pháp nhận dạng dấu, kể cả trong trường hợp mũ và thanh trong ký tự dính liền nhau – một vấn ...... hiện toàn bộ
#ký tự viết tay tiếng Việt #dấu mũ #dấu thanh #bộ phát hiện góc #tách nhánh #mô hình Markov ẩn
Một phương pháp phân đoạn tự động để mô tả các cảnh đô thị từ hình ảnh SPOT Dịch bởi AI
IEEE International Geoscience and Remote Sensing Symposium - Tập 4 - Trang 2468-2470 vol.4
Đề xuất một sơ đồ phân đoạn tự động và thích nghi để áp dụng trên các hình ảnh SPOT mô tả các cảnh đô thị. Thuật toán của chúng tôi nhằm cung cấp các hình ảnh phân đoạn bảo tồn các chi tiết tinh tế (tức là các con phố) trong khi vẫn cho thấy tỷ lệ điểm ảnh riêng lẻ thấp và các cạnh rõ ràng. Phương pháp đề xuất thực hiện nhiệm vụ phân đoạn qua ba giai đoạn chính: (a) một giai đoạn phân đoạn phi bối...... hiện toàn bộ
#Phân đoạn hình ảnh #Bố cục #Điểm ảnh #Phát hiện cạnh hình ảnh #Phát hiện khả năng tối đa #Ước lượng khả năng tối đa #Phương pháp Bayes #Mô hình rắn #Mô hình bối cảnh #Trường ngẫu nhiên Markov
Kỹ thuật thích nghi người viết trong nhận diện chữ viết tay thái hành động ngoài trực tuyến Dịch bởi AI
Proceedings Eighth International Workshop on Frontiers in Handwriting Recognition - - Trang 287-291
Nghiên cứu này trình bày việc ứng dụng các kỹ thuật thích nghi Mô hình Markov ẩn (HMM) vào vấn đề nhận diện chữ viết tay thái hành động ngoài trực tuyến. Thay vì tạo ra một mô hình mới cho mỗi người viết, người ta đầu tiên tạo ra một mô hình duy nhất từ cơ sở dữ liệu hỗn hợp, sau đó thích nghi mô hình này cho từng người viết khác nhau bằng cách sử dụng tập dữ liệu nhỏ riêng của họ. Các thử nghiệm ...... hiện toàn bộ
#Mô hình Markov ẩn #Trí tuệ nhân tạo #Cơ sở dữ liệu #Ước lượng cực đại #Nhận diện văn bản #Phương trình vi phân #Hội nghị #Nhận diện chữ viết tay #Mô hình thích nghi
Tổng số: 65   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7